【速览】TMM 2022 | 盲人画家的天使女孩
学会“成果速览”系列文章旨在将图像图形领域会议期刊重要成果进行传播,通过短篇文章让读者用母语快速了解相关学术动态,欢迎关注和投稿~
◆ ◆ ◆ ◆
TMM 2022:盲人画家的天使女孩Hang Liu ,Menghan Hu , Yuzhen Chen , Qingli Li , Guangtao Zhai ,Simon X. Yang ,Xiao-Ping Zhang ,Xiaokang Yang 华东师范大学, 上海交通大学, 加拿大圭尔夫大学, 加拿大瑞尔森大学TMM 2022撰稿人:蒋政强(盲生)、胡孟晗*通讯作者:胡孟晗
推荐理事:林宙辰、吕岳原文标题:Angels Girl for Blind Painters: an Efficient Painting Navigation System Validated by Multimodal Evaluation Approach原文链接:https://ieeexplore.ieee.org/document/9695330基金资助:国家自然基金委重点项目(61831015)、上海市教委“晨光学者”计划(19CG27)、重庆市面上项目(CQ cstc2021jcyj-msxmX0816)◆ ◆ ◆ ◆
视觉障碍问题是世界上严重的社会和公共卫生问题之一。根据世界卫生组织2017年的统计数据,全球盲人数量为3700万,视力损伤的总人数为1.61亿,其中1.24亿人患低视力[1]。此外,据统计,全球每年新增盲人数量约为100至200万。在我国,约有盲人700万,其他非全盲的视障患者1300多万,数量位居世界第一。随着老龄化进程的加快,视障这个群体仍有进一步扩大的趋势[2]。
由于视觉方面的障碍,视障人士在工作、学习、生活等各个方面都相比于拥有正常视觉的人有更大的压力。这些压力主要体现在行动障碍、阅读障碍、就业障碍、心理障碍,多方面的障碍令视障人士生活的幸福指数极大地下降,从而承受身心上巨大的痛苦。因此,一些研究人员和工程师已经着手开发包括手杖、眼镜、腰部系带在内的辅助设备, 这些设备能够帮助视力受损的人完成一些日常任务,例如室内导航,室外定位和避障。
此外,视障人士对于艺术创作也是同样充满渴望的。目前,还没有面向艺术创作的视障辅助技术相关研究。
2)画笔定位模块。经过微调的Yolo算法可以精确地定位到笔尖区域。但,绘画是一个要求精密性的活动(科学)。Yolo等目标检测算法得到的检测框并不能满足实际绘画的需求。因此,在检测框区域进行边缘检测算子操作,得到笔的轮廓图,再进行曲线拟合,找到拟合曲线的最大曲率,其对应的点即为精确笔尖位置。定位笔尖之后,需要让用户感知笔尖位置。但是,系统通过语音告知的笔尖过去位置和系统检测到的笔尖当前位置之间不可避免地存在延迟。这也是视障辅助系统研发、应用过程中存在的“感知鸿沟”难点。这个难点带来的信息不对称会最终导致系统性能下降、用户体验不佳。为了最大程度地填补外部世界和内部世界的“感知鸿沟”,在目标区域和笔尖当前位置之间设置物理空间“缓冲带”(图2)。该“缓冲带”与笔尖移动速度及方向(可等价于用户的认知空间)存在一个最优解。该映射关系可通过当前信号数据和历史信号数据自适应优化。
图 2 物理空间“缓冲带”示意图
3)语音交互模块。为了提升人机交互效率,虚拟画板被编码成AA、AB等形式。当系统计算出目标位置与笔尖区域的坐标差后,再通过四个语音提示即下、上、左、右用于引导用户将画笔移动到目标位置。为了避免混乱,系统每次只给出一个方向的引导信息。对于每一次导航,首先在垂直方向上进行引导,然后再是水平方向。当笔尖的垂直坐标和水平坐标相同时。一次引导结束。上述操作来回交替进行,即可完成一次绘画任务。
4)系统评估模块。为了验证系统的实用性,邀请了25位蒙眼人、12位盲人和4名接受过专业绘画培训的蒙眼画家使用该绘画导航系统。系统评价维度有:测试者面部的热视频用于评估情感,进而客观评价测试者对系统接受程度;笔尖出现频率的概率分布;笔尖的轨迹;图形绘画任务完成情况;任务完成时间;系统满意度调查问卷。
图 3 蒙眼专业画家使用该系统完成的作品
欢迎加入中国图象图形学学会
(http://membership.csig.org.cn )
中国图象图形学学会关于组织开展科技成果鉴定的通知